(网经社讯)10月14日,蚂蚁集团正式推出并开源了其万亿参数思考模型Ring-1T,包括模型权重与训练配方。该模型是在2025年9月30日开源的预览版Ring-1T-preview基础上进一步优化的成果,通过扩展大规模可验证奖励强化学习(RLVR)训练增强了自然语言推理能力,并结合人类反馈强化学习(RLHF)提升了模型的通用性能,使其在多任务评估中表现更为均衡。
据网经社产业电商台(B2B.100EC.CN)获悉,Ring-1T基于Ling 2.0架构,总参数量达到1万亿,激活参数为500亿,支持128K上下文长度。在技术实现上,蚂蚁采用了自研的“棒冰(icepop)”算法以控制训练和推理阶段的精度差异,保障了长序列训练的稳定性;同时,其高性能强化学习系统ASystem优化了显存管理和权重交换,实现了大规模强化学习的日常化稳定训练。
在多项权威测试中,Ring-1T展现出领先水平。例如,在国际数学奥林匹克竞赛(IMO2025)的解题测试中,该模型一次解出第1、3、4、5题,达到银牌水平,成为首个能达到国际奥数奖项级别的开源系统。在人类偏好对齐测试Arena-Hard V2中,它以81.59%的成功率位居开源模型榜首,成绩接近GPT-5-Thinking(High)的82.91%。在医疗问答基准HealthBench中,Ring-1T也取得了开源模型中的最高分。
目前,Ring-1T已在Hugging Face、魔搭社区等平台开源,用户可下载模型或通过蚂蚁百宝箱进行在线体验。至此,蚂蚁百灵大模型已发布18款模型,参数范围从160亿到1万亿,形成了包括通用语言模型Ling-1T和思考模型Ring-1T在内的产品矩阵,标志着其大模型进入2.0阶段。